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摘 要 : [目的 /意义 ] 专利 文献 与 学 术 论文 分 别 表现 了 技术 创新 与 科学 研究 的 新 进展 ,通过 专利 主体 将 二 者 结合 进行 技术 
主题 演化 分 析 , 对 进一步 发 现 专 利 技术 与 科学 研究 间 的 关系 有 一 定 的 参考 意义 。[ 方 法 /过 程 ] 以 数据 挖掘 领域 的 
学 术 型 发 明 人 为 纽带 ,从 专利 主体 - 关键 词 耦 合 、IPC 耦合 以 及 IPC - 关键 词 共 现 3 个 角度 ,提出 关联 方法 并 构建 
研究 框架 ,分 析 不 同时 间 段 下 主体 、 技 术 及 主题 多 维 关 联 关系 的 演化 ,探究 数据 挖掘 领域 内 专利 文献 与 学 术 论 文 
的 主体 、 主 题 关联 关系 。[ 结果 /结论 ] 学 术 型 发 明 人 在 数据 挖掘 技术 创新 中 的 作用 越 来 越 重要 ,大 多 主体 的 技术 
主题 是 相近 的 ,部 分 甚至 呈现 高 度 的 统一 ,但 是 也 存在 少数 技术 与 主题 不 直接 相关 ,差异 度 较 大 ,但 不 论 技术 与 主 
题 是 否 直接 相关 ,数据 挖掘 相关 技术 发 明 与 科学 研究 都 已 经 实现 了 较为 深入 的 相互 渗透 。 
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忆 新 一 轮 科技 革命 和 产业 变革 正在 孕育 兴起 ,全 球 
科 靶 创新 呈现 出 新 的 发 展 态势 和 特征 ,科学 技术 的 创 

起 发 展 的 直接 动力 。 但 在 我 国 当前 科技 发 展 实 践 
纠 6 科 学 与 技术 尚未 呈现 出 良好 的 互动 态势 ,主要 表现 
在 圭 分 科学 研究 成 果 无 法 及 时 应 用 于 技术 实践 ,诸多 
技 坟 问 题 往 往 因 缺 少 新 的 科学 成 果 而 得 不 到 有 效 解 
决 四 ,一 定 程度 上 限制 了 科技 进步 与 社会 发 展 。 对 此 ， 
厘清 科学 与 技术 的 关联 关系 尤为 重要 ,陆续 已 有 学 者 
对 科学 与 技术 的 关系 及 相关 研究 方法 进行 探究 , 旨 在 
促进 二 者 相互 渗透 .相互 作用 ,加 速 科学 技术 的 交叉 融 
合 。 目 前 ,科学 研究 的 成 果 主要 以 学 术 论 文 的 形式 产 
出 ,而 专利 信息 作为 可 获得 的 最 大 技术 信息 源 , 承 载 了 
技术 创新 的 核心 内 容 ,因此 科学 技术 关联 主要 体现 在 
专利 文献 与 学 术 论文 的 关联 发 现 。 图 情 领 域 对 专利 文 
献 与 学 术 论文 间 的 关系 陆续 有 所 研究 ,早年 研究 多 从 
主体 间 关 系 ( 发 明 人 与 作者 间 关 系 ) 探究 科学 与 技术 
的 关系 ”“ ,但 2010 年 以 后 对 专利 文献 与 学 术 论文 关 


| 


联 的 研究 则 重点 从 内 容 的 角度 出 发 ,以 更 深入 地 探究 
科学 与 技术 的 关系 。 

近年 来 国外 图 情 领域 的 学 者 对 专利 文献 与 学 术 论 
文 的 探索 主要 集中 在 二 者 的 共 引 关系 上 ,表现 为 3 个 
方面 :@ 通 过 分 析 专 利文 献 中 学 术 论 文 的 引用 情况 ,或 
学 术 论 文中 专利 的 引用 情况 ,分 析 发 现 引用 关系 的 变 
化 ““ ;加 通过 专利 与 学 术 论 文 的 互 引 , 探 究 知识 在 学 
术 向 技术 流动 过 程 中 的 促进 作用 ”“ ;@@ 通 过 互 引 关 
系 ,构建 引用 网 络 , 对 网 络 进行 拓扑 分 析 , 探 究 技 术 与 
知识 在 领域 发 展 中 发 挥 的 作用 ”"” 。 在 互 引 角度 的 研 
究 文献 较 多 ,也 取得 了 一 定 的 成 果 。 除 此 之 外 ,也 有 学 
者 通过 技术 主题 演化 来 探究 领域 主题 演变 情况 ,并 
在 此 基础 上 提出 推荐 系统 以 提高 简单 词 检 索 的 检 全 
率 '” ,从 词 的 角度 进行 探究 ,提供 研究 参考 。 同 时 ,对 
于 专利 与 科技 文献 的 关系 发 现 不 只 局 限于 理论 研究 ， 
领域 学 者 也 进行 了 应 用 研究 ,通过 对 专利 文献 与 学 术 
论文 间 多 种 关系 的 研究 ,发 现 某 主题 领域 内 的 技术 发 
展 情况 ,探究 区 域 经 济 增长 的 情况 '” ,乃至 对 国家 、 
机 构 等 的 科研 生产 力 投入 产 出 的 综合 评价 "等 。 
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国内 关于 专利 文献 与 学 术 论文 的 研究 相对 国外 较 
晚 , 共 引 关系 首先 成 为 国内 研究 的 基础 “" 。 近 几 年 
随 着 本 体 .语义 网 的 发 展 ,有 学 者 从 词 的 角度 ,利用 科 
学 计量 的 方法 ,挖掘 专利 与 学 术 论文 的 关系 ,如 主题 关 
联 演化 "” .相似 度 的 计算 方法 "” 等 ,提供 了 新 的 研究 
角度 。 在 应 用 方面 ,除了 特定 领域 的 技术 .研究 发 展 情 
况 的 探寻 ,前 沿 热 点 的 相关 研究 中 也 考虑 到 了 专利 文 
献 的 技术 贡献 思 
国内 的 专利 文献 缺少 引文 项 的 内 容 , 而 专利 的 分 
类 方式 和 学 术 论文 的 分 类 方式 也 存在 差异 ,因此 不 适 
合 直接 进行 引文 分 析 或 分 类 号 关联 分 析 。 本 文 提出 从 
专利 主体 的 角度 出 发 ,专利 权 人 是 专利 的 所 有 者 ,而 专 
利 发 明 人 作为 技术 的 开发 人 员 , 同 时 也 可 能 是 学 术 型 
研究 者 ,基于 这 两 类 主体 ,可 以 建立 创新 专利 与 科学 研 
完 蕊 果 间 的 关系 ,通过 分 析 专 利 主体 - 文献 关键 词 烛 
全 隐情 况 以 及 专利 主题 辜 合 关系 ， 进而 构建 专利 主题 
与 议 南 关 键 词 网 络 ,并 以 “数据 挖掘 "领域 为 例 ,分 析 
探 哆 “数据 挖掘” 主题 下 专利 主体 - 技术 主题 - 文献 
关 娃 词 的 演化 规律 ,希望 为 专利 文献 与 学 术 论文 的 关 
更 风 供 考 作 用 


2 专利 主体 - 关键 词 耦合 概念 界定 及 相 
类 洲 究 现状 


专利 主体 - 关键 词 耦合 概念 界定 
2.4SL 专利 主体 的 概念 及 界定 
.三 专利 主体 是 与 专利 的 形成 .申请 、 利 用 等 专利 生命 

周期 相关 的 主体 ， 因此 现实 意义 上 ,一 项 专利 技术 一 般 
存在 多 个 主体 。 比如 ,作为 专利 发 明 创造 中 的 核心 部 
分 的 发 明 人 ,直接 参与 完成 发 明 创造 ,是 对 于 发 明 创造 
作出 了 创造 性 贡献 的 人 ” ;申请 人 则 是 指 依法 享有 某 
项 发 明 创造 、 向 国务 院 专利 行政 部 门 提出 专利 申请 的 
自然 人 、 法 人 或 其 他 组 织 ;而 专利 权 人 则 是 专利 所 
有 权 的 拥有 者 。 此 外 ,专利 主体 还 包括 专利 受 让 人 、 专 
利 代理 人 等 多 个 主体 。 但 对 于 一 项 专利 ,专利 权 人 和 
发 明 人 是 必 不 可 少 的 。 当 专利 发 明 人 本 吴 也 是 技术 的 
所 有 人 时 ,发 明 人 是 申请 人 也 是 专利 权 人 ,但 对 于 机 构 
而 言 ,专利 权 人 一 般 是 本 机 构 , 由 相关 的 开发 团队 进行 
发 明 。 

学 术 型 发 明 人 是 特殊 的 专利 发 明 人 ,王刚 波 、 官 建 
成 的 文章 ”中 定义 , “学 术 型 发 明 人 ”来 源 于 文献 中 
“Academic Inventor 一 词 的 翻译 ,是 指 在 大 学 中 既 从 事 
学 术 研 究 又 从 事 专 利 活动 `. 既 具有 论文 作者 身份 又 具 


有 专利 发 明 人 身份 的 研究 者 。 本 文 认为 ,具有 学 术 创 
作 且 有 学 术 文献 产 出 的 专利 发 明 人 , 即 为 学 术 型 发 明 
ss 


由 于 本 文 是 通过 专利 主体 发 现 专利 文献 与 学 术 论 
文 间 的 关联 关系 ,因此 将 专利 主体 限定 为 专利 权 人 和 
专利 发 明 人 ,专利 权 人 可 以 是 机 构 也 可 以 是 个 人 ,专利 
发 明 人 则 只 能 是 个 人 。 专 利 权 人 是 专利 的 所 有 人 ,对 
应 着 专利 文献 ; 而 该 专利 条 目 信 息 中 对 应 的 发 明 人 , 同 
时 也 可 能 进行 着 学 术 创作 ,对 应 着 学 术 论 文 。 因 此 通 
过 专利 主体 ,可 以 有 效 地 建立 专利 文献 与 学 术 论文 的 
关系 。 
2.1.2 专利 主体 -关键 词 耦合 的 概念 及 界定 

在 图 书 情报 领域 的 研究 中 ,学 者 们 普遍 认为 关于 
耦合 的 研究 最 早 是 由 美国 人 开 斯 勒 提 出 的 ,如 在 4《 论 
“引文 耦合 与 “ 同 被 引 ”》 一 文中 提 到 :美国 学 者 开 其 
勒 (M. M. Kessler) 博士 于 1963 年 首次 提出 了 文献 耦合 
(Bibliographic Coupling ) 的 概念 。 开 斯 勒 发 现 了 引 
文 耦 合 规律 献 与 B 文献 同时 引用 了 C 
文献 , 则 A 和 B 之 间 存 在 耦合 关系 ,A 和 B 之 间 是 存在 
相近 关系 的 ,这 种 耦合 同样 可 以 应 用 在 专利 主体 - 关 
键 词 的 耦合 上 。 

专利 主体 - 关键 词 耦 合 则 是 专利 权 人 与 关键 词 之 
间 的 耦合 ,这 里 的 关键 词 并 非 专利 文献 的 主题 词 ,而 是 
指 科技 文献 中 的 关键 词 。 文 章 借助 专利 文献 给 出 的 专 
利 权 人 与 发 明 人 ,以 专利 发 明 人 为 中 介 , 在 中 国 知 网 及 
万 方 数据 库 中 检索 发 明 人 发 表 的 学 术 论文 并 记录 论文 
的 关键 词 , 从 而 形成 专利 权 人 与 关键 词 的 斐 合 网 络 。 
通过 专利 发 明 人 建立 专利 主体 (专利 权 人 ) 与 关键 词 
的 耦合 关系 ,以 找到 与 该 专利 相关 性 较 高 的 科技 文献 ， 
并 提供 对 应 的 关键 词 以 用 作 相 关 分 析 。 
2.2 ”可行 性 分 析 
2.2.1 国内 专利 少 有 引文 ,引文 关联 研究 存在 盲区 

在 基于 专利 文献 与 学 术 论 文 的 关联 发 现 研 究 中 ， 
虽然 国内 外 的 研究 手段 主要 集中 在 引文 网 络 方面 ,但 
是 中 国 的 专利 数据 库 基本 没有 引用 专利 , 仅 有 最 近 几 
年 专利 审查 员 添 加 的 极 少数 引用 专利 。 同 时 ,专利 
文献 与 科技 文献 的 体例 范式 不 同 ,内 容 的 侧重 点 也 有 
所 不 同 ,这 使 得 学 者 在 学 术 创 作 中 很 少 引 用 专利 文献 ， 
在 专利 引用 的 相关 研究 中 会 形成 一 定 的 盲区 。 
2.2.2 主题 作为 知识 单元 ,能 较 好 反映 主体 的 学 术 背 景 

人 中 ,主题 作为 中 观 层次 的 知识 单 

是 从 内 容 的 角度 代表 了 该 文献 作者 的 特定 研究 

as 在 科学 与 技术 的 知识 网 络 中 ,虽然 
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主题 单元 是 表征 知识 内 容 的 隐 性 科学 分 子 , 但 是 与 其 
他 知识 单元 关联 密切 ,有 着 影响 科学 发 展 历程 与 趋向 
的 作用 2 。 虽 然 主 题 可 以 从 分 类 的 角度 来 揭示 ,但 是 
专利 文献 与 学 术 论文 的 分 类 体例 相差 甚 远 ,无 法 全 面 
合理 地 建立 映射 关联 ,因此 仍 需要 从 词 的 角度 出 发 ,在 
内 容 上 将 相似 的 节点 关联 ,进而 发 现 专利 文献 与 学 术 
论文 的 关系 。 
2.2.3 ”专利 主体 是 专利 文献 与 学 术 论 文 关系 构建 的 
基础 

专利 的 分 类 是 按照 其 应 用 领域 进行 分 类 的 ,而 科 
技 文献 是 按照 中 图 分 类 法 进行 分 类 的 ,二 者 有 很 大 的 
差别 ,因此 不 能 直接 通过 主题 词 进行 映射 关联 。 主 体 
作为 技术 、 知 识 的 承载 者 ,在 促进 科学 技术 间 知 识 流动 
发 挥 着 重要 作用 。 在 专利 发 明 创造 中 ,参与 的 发 明 

能 是 学 术 型 发 明 人 ,通过 跟踪 该 类 发 明 人 的 学 术 
诊 允 ,与 专利 文献 建立 联系 ,能 较 好 地 反映 技术 发 展 中 
ee， 


系 究 专利 文献 与 学 术 论 文 的 关联 关系 及 其 演化 规 
很 v 能 较为 容易 地 从 专利 主体 的 学 术 背景 和 技术 创新 
的 角度 来 实现 研究 目标 。 

CJ 因此 文章 基于 专利 主体 (以 学 术 型 发 明 人 为 主 )， 
BB 利 IPC 与 学 术 论 文 的 关键 词 为 研究 对 象 ,进而 控 
守 潼 利 主体 与 文献 主题 间 、 专 利 主体 与 技术 间 以 及 技 
术 汪 文献 主题 间 的 关系 ,发 现 技术 主题 演化 的 规律 。 
交锋 可 获得 ,能 够 较 好 地 实现 技术 领域 内 专利 文献 与 

论文 间 关 联 关系 的 发 现 。 


3 二 关联 方法 及 框架 构建 


络 ; 最 后 ,通过 专利 主体 ,构建 起 专利 技术 主题 与 文 
献 关 键 词 间 的 关系 网 络 ,进而 发 现 专利 文献 与 学 术 
论文 间 的 关系 。 


分 析 结果 


和 术 沪 化 网 络 
p> 
技术 关联 关系 

办 和 格 演 化 网 络 


联系 
专利 了 PC+ 关键 词 技术 - 主题 看 合 


分 析 内 容 分 析 方 法 


图 1 整体 研究 框架 


3.1 专利 主体 - 关键 词 耦合 网 络 

专利 主体 与 文献 关键 词 的 关联 ,实则 是 以 学 术 型 
发 明 人 为 纽带 ,指向 发 明 人 对 应 的 专利 文献 以 及 发 表 
的 学 术 论 文 。 笔 者 基于 中 国 知 网 和 万 方 数 据 库 检索 了 
专利 发 明 人 在 专利 申请 的 前 2 年 内 发 表 的 学 术 论 文 ， 
记录 该 项 专利 的 专利 权 人 以 及 对 应 发 明 人 发 表 学 术 论 
文 的 关键 词 ,进而 构建 专利 主体 与 文献 关键 词 的 耦合 
网 络 , 如 图 2 所 示 。 由 于 一 般 来 说 发 明 专 利 自 申请 日 
起 18 个 月 后 公开 ,因此 本 文选 择 了 发 明 人 在 专利 申请 
日 前 2 年 内 发 表 的 学 术 论文 ,并 记录 论文 关键 词 , 这 些 
关键 词 一 定 程度 上 可 以 反映 发 明 人 的 技术 背景 或 者 在 
专利 发 明 期 间 的 主要 技术 方向 。 

一 条 专利 记录 对 应 专利 权 人 1 和 专利 权 人 2 ,专利 
权 人 1 对 应 发 明 人 11 ,发明 人 12 以 及 发 明 人 13 ,专利 
权 人 2 对 应 发 明 人 21 发 明 人 22, 不 同 的 发 明 人 又 对 
应 不 同 的 文献 关键 词 a - h, 最 终 形成 了 一 项 专利 的 专 


专利 主体 既 参 与 了 专利 的 发 明 创新 ,又 进行 了 学 
术 创 作 , 因 此 其 对 应 的 专利 文献 与 学 术 论文 之 间 主 题 
较为 相近 。 以 专利 文献 与 学 术 论文 为 基础 ,以 专利 主 
体 为 中 介 ,从 专利 主体 - 关键 词 耦合 .技术 演化 以 及 技 
术 主 题 关 联 ,来 探究 数据 挖掘 领 域 专利 文献 与 学 术 
论文 间 的 关联 关系 。 其 整体 研究 框架 如 图 1 所 示 ,一 
项 专利 技术 对 应 一 个 或 多 个 专利 权 人 ,进而 对 应 多 
个 发 明 人 ,而 部 分 发 明 人 同时 进行 了 学 术 创作 ,同时 
期 公开 发 表 了 学 术 论 文 ,因此 专利 文献 与 学 术 论文 
间 可 基于 专利 主体 建立 一 定 的 联系 , 即 “专利 文献 - 
专利 权 人 - 专利 发 明 人 - 学 术 论文 "的 关系 。 本 研 
究 中 ,首先 对 既定 技术 主题 进行 专利 文献 的 检索 , 记 
录 详 细 数据 ;之 后 通过 专利 信息 ,形成 相应 的 技术 共 
现 网 络 ;同时 ,通过 专利 主体 检索 相关 的 学 术 论 文 ， 
并 记录 论文 关键 词 ,形成 专利 主体 -关键 词 硒 合 网 


利 权 人 与 关键 词 间 的 耦合 关系 。 
3.2 技术 共 现 网 络 

技术 的 耦合 情况 ,主要 从 专利 IPC 分 类 号 的 耦合 
来 表示 。 专 利 的 分 类 是 按照 其 应 用 领域 进行 分 类 的 ， 
因此 只 包括 8 个 大 部 ,采用 等 级 的 方式 ,对 部 -大 类 - 
小 类 -大 组 - 小 组 进行 逐 级 分 类 ,如 图 3 所 示 (IPC 号 
具体 含义 可 见 国家 知识 产权 局 - 中 国 专利 公布 公告 : 
http ://epub. sipo. gov. cn/ipc. jsp ) 。 

一 个 专利 可 能 有 多 个 IPC 分 类 号 ,同时 涉及 多 个 
技术 领域 ,对 专利 的 IPC 分 类 号 进行 共 现 处 理 , 可 以 反 
映 特定 主题 下 的 核心 技术 领域 .边缘 技术 领域 以 及 各 
技术 领域 之 间 的 关系 。 之 后 利用 PageRank 对 节点 进 
行 统计 处 理 , 通 过 对 边 的 计算 来 反映 网 络 中 节点 代表 
的 技术 领域 的 重要 程度 。 


108 


宁 子 晨 ， 魏 来 . 专利 主体 视角 下 专利 文献 与 学 术 论 文 关联 关系 发 现 研究 


2020 ,64(12 ) :106 -117. 


, 主 丁 5 网 中式 未 合集 绚 乔 
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ee 


专利 APC 分 类 号 


专利 权 人 2 


图 2 专利 主体 与 关键 词 耦 合 关系 


Gephi 对 PageRank 算法 做 了 修正 ,减弱 了 “自私 互 
此 关系 节点 ”以 及 “无 出 人 度 节点 ”等 对 网 络 中 关系 的 
影响 ,可 以 在 呈现 专利 IPC 耦合 关系 的 基础 上 , 反 


GO6F17/30 


G 物理 | 06 计 算 ; 推算 ; 计数 
部 


大 类 


F 电 数字 数据 处 理 


小 类 


映 专利 IPC 的 重要 程度 ,进而 从 专利 的 层面 分 析 技 术 
的 关联 情况 。 


17/00 特别 适用 于 特定 功能 的 数字 计算 设备 大 组 
或 数据 处 理 设备 或 数据 处 理 方法 


17130 信息 检索 :及 其 数据 库 结构 4 得 


组 
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3 导 专利 技术 -文献 关键 词 关系 网 络 
CD 技术 主要 是 通过 专利 PC 来 表现 , 关键 词 则 是 学 
得 外 文 的 关键 词 , 技 术 - 主题 网 络 实则 是 IPC 分 类 号 
词 共 现 的 结果 。 由 于 参与 一 项 专利 创新 的 发 明 
人 代数 不 定 , 则 一 条 专利 记录 对 应 的 技术 背景 涉及 多 
全 序 面 。 同 时 这 些 发 明 人 在 对 应 时 间 内 的 发 文 情况 也 
人 
可 外 很 高 ,因此 需要 首先 确定 关键 词 的 范围 ,进而 构建 
技 玉 - 主题 网 络 。 
〇 在 关键 词 范 围 的 选择 上 ,利用 Gephi 的 K -核心 
对 专利 主体 - 关键 词 耦合 网 络 的 数据 进行 过 滤 , 通 过 
显示 度 来 判断 是 核心 关键 词 还 是 边缘 关键 词 。 核 心 关 
键 词 可 以 有 效 地 涵盖 研究 领域 中 知识 点 的 整体 分 布 ， 


领 


图 4 


图 3 专利 IPC 分 类 号 及 示例 


同样 地 , 它 也 可 以 反映 出 某 一 项 专利 的 主要 技术 方向 
或 学 科 所 属 ,因此 核心 关键 词 的 选择 是 必 不 可 少 的 。 
边缘 关键 词 虽 然 连接 度 低 , 但 内 容 多 样 ,一 定 程度 上 可 
以 反映 弱 相 关 的 主题 与 技术 之 间 的 隐 性 关系 ,因此 也 
需要 考虑 这 类 词 的 变化 情况 。 

关键 词 确定 之 后 ,基于 专利 主体 构建 专利 IPC 与 
关键 词 的 共 现 网 络 。 将 同一 时 间 段 下 同一 专利 IPC 与 
核心 .边缘 关键 词 分 别 聚 合 ,重复 的 关键 词 进行 频次 累 
加 处 理 , 如 图 4 所 示 。 最 终 可 以 得 到 所 有 核心 边缘 关 
键 词 与 IPC 分 类 号 的 对 照 关 系 , 即 形成 IPC 分 类 号 - 
核心 关键 词 矩 阵 , 将 其 可 视 化 结果 进行 模块 化 处 理 , 模 
块 间 耦 合 度 较 低 ,模块 内 聚合 度 较 高 ,进而 可 以 对 技术 
与 主题 间 的 关系 进行 探索 。 
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4 ”基于 主体 的 专利 文献 与 学 术 论 文 关联 
发 现实 证 分 析 


4.1 数据 的 选取 

大 数据 因为 近年 来 互联 网 和 信息 行业 的 发 展 而 引 
发 人 们 的 关注 ,有 效 地 对 数据 进行 收集 分析、 保存 以 
及 共享 ,可 以 为 科研 提供 有 效 的 帮助 ,为 用 户 解决 切实 
的 问题 。 本 文 以 “数据 挖掘 ”为 主题 ,在 中 国 专利 局 
“专利 检索 与 分 析 " 数 据 库 中 进行 检索 ,利用 布 拉 德 福 
定律 确定 核心 专利 权 人 (机 构 )22 个 以 及 相关 专利 数 
据 248 条 。 疏 取 详细 的 专利 数据 ,包括 专利 题名 .申请 
号 .申请 人 \ 公 开 号 ` 公 开 上 日.IPC 分 类 号 .申请 人 以 及 
发 明 人 等 数据 。 

本 为 了 方便 分 析 科 学 技术 的 演变 情况 ,将 248 条 专 
利 数据 按 2004 - 2008 年 .2009 - 2013 年 .2014 - 2018 
牧人 个 时 间 段 分 为 3 组 ,并 分 别 编号 为 "1001 .1002… 
2099、2002 …3001 .3002 .3003 …3150”。 其 中 ,首位 数 
学 假 表 所 属 时 间 段 ,如 “lxxx" 代 表 在 2004 -2008 年 内 
的 妹 利 数据 ， 

CB 之 后 对 这 248 条 专利 数据 中 的 专利 发 明 人 发 表 过 
2 术 论 文 进行 检索 :在 中 国 知 网 以 及 万 方 数 据 库 中 ， 
络 利 发 明 人 的 姓名 为 “作者 ”专利 权 人 的 名 称 为 
“单位 ”对 应 专利 申请 时 间 的 前 2 年 为 “发 表 时 间 ” 进 
行 限 定 检索 ,下 载 全 部 的 题 录 信息 并 进行 合并 整理 去 
重 g 则 样 进行 编号 “1001 .1002 .… 2001 、2002 … 3001、 
3007 3003 …3150”。 

己 通 过 编号 关联 整合 专利 信息 和 学 术 论文 的 数据 ， 
将 负 据 导入 Gephi0.9.2 中 ,分 3 个 时 间 段 进行 个 别 和 
整体 分 析 。 

4.2 结果 
4.2.1 IPC 共 现 结果 

利用 BibExcel 对 数据 进行 处 理 ,同时 利用 Gephi 
的 PageRank 进行 成 图 ,得 到 2004 - 2008 年 、2009 - 
2013 年 .2014 -2018 年 “数据 挖 气 ”相关 专利 分 类 号 的 
耦合 情况 ,如 图 5 - 图 7 所 示 , 各 耦合 网 络 的 相关 参数 
如 表 1 所 示 。 

由 于 本 文 对 IPC 分 类 号 作 耦 合 化 处 理 , 因 此 网 络 
中 的 “孤立 点 "被 吻 除 , 仅 留 下 了 存在 关系 的 节点 。 从 
网 络 参数 上 来 看 :D3 个 时 间 段 的 节点 数 、 边 数 以 及 平 
均 加 权 度 都 是 增加 的 ,这 符合 技术 的 发 展 情况 ,多 技术 
相 融 合 ,共同 进行 创新 。@@ 连 接 组 件 是 指 子 图 中 的 各 
个 节点 间 通 过 边 相 连 ,但 是 子 图 间 是 不 存在 关系 的 。3 


个 时 间 段 的 连接 组 件 参 数 很 小 ,但 略 有 增加 ,节点 / 连 
接 组 件 的 值 也 是 增长 趋势 ,可 见 耦 合 关系 网 络 是 增长 
的 , 子 图 也 是 扩张 容纳 更 多 的 技术 节点 。@3 个 时 间 
段 下 的 图 密度 很 小 , 且 随 着 时 间 不 断 减 小 ,说 明 耦 合 网 
络 关系 的 增长 与 节点 的 增长 是 不 匹配 的 ,虽然 节点 和 
边 都 增加 了 ,但 实际 构成 的 耦合 网 络 是 越 来 越 稀 玻 的 。 
此 外 ,平均 路 径 长 度 的 增加 也 说 明了 网 络 是 愈加 稀 玻 
的 。 

2004 - 2008 年 间 的 IPC 通过 中 心 节点 G06F17/30 
建立 关系 ,形成 一 个 子 群 ,节点 间 的 耦合 度 基本 一 致 。 
在 2009 - 2013 年 间 , 节 点 间 的 关系 变 复 杂 , 在 以 
G06F17/30 为 中 心 节点 的 子 群 之 外 ,又 出 现 了 2 个 新 
的 子 群 。 在 IPC 的 耦合 度 方 面 , 606F17/30 与 
H04129/06(08) .G06N3/12 以 及 G06F17/50(27) 有 着 
较 强 的 耦合 度 。 而 在 2014 年 之 后 ,专利 IPC 的 耦合 关 
系 更 加 复杂 ,中 心 节点 变 为 G06F17/30 以 及 G06Q50/ 
06 , 子 群 的 个 数 以 及 子 群 内 部 的 节点 数 相 对 2009 - 
2013 年 间 有 所 增加 。 这 一 阶段 中 , G606Q50/06 与 
G06Q10/06 的 耦合 度 最 高 , 其 次 是 6C06Q50/06 与 
G06F17/30 .G06Q50706 与 C06Q10/04 ,节点 耦合 度 高 ， 
说 明 一 项 专利 技术 同时 涉及 这 几 个 节点 所 代表 的 领 
域 ,应 用 范围 较 广 。 专 利 IPC 的 增加 以 及 网 络 愈加 复 
林 , 一 方面 说 明 “ 数 据 挖掘 ” 越 来 越 多 地 被 应 用 在 多 个 
领域 , 男 一 方面 也 体现 了 多 领域 的 技术 、 知 识 被 运用 在 
数据 挖掘 中 ,是 学 科 融 合 的 体现 。 

表 1 专利 IPC 耦合 网 络 参数 


度量 指标 2004 -2008 年 ” 2009 -2013 年 2014 -2018 年 
节点 4 15 44 
边 4 13 61 
平均 加 权 度 2 2.4 3 
网 络 直径 (D .R 、APL) 2 .1.1.333 3 .1.1.857 5 .1.2.482 
图 密度 0.667 0. 124 0.064 
连接 组 件 (孤立 点 ) 1 3(7) 6(14) 
平均 聚 类 系数 0.778 0.342 0. 808 
特征 向 量 中 心 度 0.000 016 43 0.00068844 0.002 982 25 


注 : 表 中 D、R、APL 分 别 代表 直径 .半径 .平均 路 径 长 度 
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图 5 2004 -2008 年 专利 了 PC 耦合 网 络 
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图 6 2009 -2013 年 专利 IPC 耦合 网 络 


Gos@go'o2 


Go6EGsooe 


fo/o6 
Hoage/40 Ho4Ep/o6 


、 B24 100 
weHO4 /176 
Go5 国 有/415- 
HO4 151 
So06 本 "16. 
HO /96 
GO 


4@GD 专利 主体 - 关键 词 看 合 结果 
利用 Gephi 呈现 2004 - 2008 年 .2009 -2013 年 、 
26 训 - 2018 年 “数据 挖掘 "相关 专利 主体 - 关键 词 的 
耦 众 情况 ,如 图 8 - 图 10 所 示 ,各 耦合 网 络 的 相关 参数 
巡 自 2 所 示 : 
表 2 专利 主体 -关键 词 耦合 网 络 参数 


2304.00200v1 


全 度量 指标 2004 -2008 年 2009 -2013 年 2014 -2018 年 
(© 节点 94 714 5 998 
边 103 904 14 413 
平均 加 权 度 2.191 2.532 4.806 

网 络 直 径 (D .R 、APL) 5 .3 .3.044 8 4.4.162 7 ,4.3.544 
图 密度 0. 024 0. 004 0.001 
模块 个 数 3 11 18 

模块 度 0.564 0.814 0.617 


注 : 表 中 DR、APL 分 别 代表 直径 ,半径 ,平均 路 径 长 度 

从 网 络 参 数 上 来 看 :GD3 个 时 间 段 的 节点 数 . 边 数 
的 增长 迅猛 ,平均 加 权 度 也 是 增加 的 ,这 表明 了 随 着 时 
间 发 展 ,专利 主体 增多 ,专利 涉及 的 研究 主题 也 增多 且 
趋向 融合 。@) 网 络 模块 解析 度 的 值 为 默认 值 1. 0 ,得 
到 模块 个 数 由 最 初 的 3 个 增长 到 18 个 ,节点 标签 的 大 
小 表示 该 节点 在 网 络 中 的 重要 程度 , 子 群 内 部 相关 性 
更 高 。(3)3 个 时 间 段 的 图 密度 很 小 , 且 随 着 时 间 不 断 
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7 2014 -2018 年 专利 IPC 耦合 网 络 


减 小 ,说 明 虽 然 网 络 的 节点 和 边 都 增加 了 ,但 实际 构成 
的 耦合 网 络 是 越 来 越 稀 玻 的 。 

2004 -2008 年 间 的 3 个 核心 专利 主体 是 清华 大 
学 .上 海 交 通 大 学 以 及 浙江 大 学 ,3 个 主体 间 的 共有 
关键 词 较 少 , 仅 有 “数据 融合 “特征 选择 ”与 “数据 
挖掘 ”。 在 2009 -2013 年 间 ,模块 个 数 增 加 到 11 个 ， 
核心 节点 增加 了 国家 电网 .重庆 大 学 .南京 邮电 大 学 
等 ,但 是 清华 大 学 在 这 一 阶段 的 表现 不 显著 。 模 块 
间 的 关系 也 变 得 复杂 ,相对 于 图 8, 图 9 的 主体 间 的 
关系 增多 , 独立 性 降低 。 共 有 的 关键 词 增多 ,包括 
“网 格 计算 “支持 向 量 机 ”“ 分 布 式 计算 “监控 系 
统 ”“IEC61850”“ 综 合 应 用 服务 器 "“ 谐 波 治理 ”“ 智 
能 变电站 ”“ 认 知 无 线 电 ”等 。 在 2014 年 之 后 ,专利 
主体 - 关键 词 耦合 网 络 明显 复杂 化 ,国家 电网 公司 
占据 了 网 络 最 核心 的 位 置 。 其 次 ,各 所 邮电 大 学 也 
逐渐 轿 露 头角 ,成 为 核心 节点 。 共 有 关键 词 的 频次 
和 数量 都 所 有 增长 ,高 频 共 有 关键 词 有 "大 数据 ”““ 神 
经 网 络 “ 多 目标 优化 ”支持 向 量 机 ”关联 规则 ” 
“ 储 能 系统 ”“ 层 次 分 析 法 ”等 。 网 络 趋 于 复杂 ,专利 
主体 的 增长 变化 体现 了 领域 内 机 构 的 变化 ,而 关键 
词 节点 的 增长 则 体现 了 技术 领域 的 发 展 , 耦 合 度 高 
的 关键 词 则 在 网 络 中 的 重要 程度 更 高 ,在 促进 技术 
发 展 中 发 挥 着 更 为 重要 的 作用 。 
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4.2.3 IPC -关键 词 共 现 结果 

利用 Gephi 呈现 IPC -核心 关键 词 网 络 和 IPC - 边 
缘 关 键 词 网 络 ,如 图 11 -图 13 所 示 , 节 点 的 大 小 代表 
该 点 在 网 络 中 的 重要 程度 ,而 节点 的 灰 度 则 是 模块 化 
的 区 分 。 

IPC - 核心 关键 词 共 现 结果 为 :在 2004 - 2008 年 
间 主 要 形成 2 个 模块 ,2009 -2013 年 间 形 成 3 个 模块 ， 
2014 -2018 年 间 形 成 7 个 模块 ;IPC - 边缘 关键 词 共 现 
结果 为 :在 2004 - 2008 年 间 主 要 形成 2 个 模块 ,2009 
-2013 年 间 形 成 5 个 模块 ,2014 - 2018 年 间 形 成 13 
个 模块 。 边 缘 共 现 网 络 相 较 核 心 共 现 网 络 更 加 分 散 ， 
形成 的 子 群 间 缺 少 联系 ,这 在 模块 个 数 上 也 得 到 了 体 
现 。IPC 和 关键 词 的 分 布 情况 如 下 : 


(1)IPC -核心 关键 词 共 现 网 络 2004 - 2008 年 间 ， 
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IPC 主要 为 GC06Q50/00 .G06Q10X00 和 GO6F17730 , 对 


IPC 主要 为 G06F19/00 和 G06F17/30 ,涉及 的 关键 词 主 
要 是 计算 机 视觉 .应 用 方向 (电力 、 能 源 )、 服务器 承 压 


应 的 技术 领域 至 小 类 为 物理 部 - 计算 推算 计数 大 类 
电 数 字数 据 处 理 小 类 和 数据 处 理 系统 或 方法 小 类 ; 关 
键 词 主 要 是 网 络 开发 ,服务 发 现 相关 。2009 -2013 年 
间 ,IPC 主要 为 G06F17/30、H04L29/06 以 及 G06F21/ 
55 等 ,对 应 的 技术 领域 至 小 类 为 物理 部 -计算 推算 计 
数 大 类 - 电 数 字数 据 处 理 小 类 、 电 学 部 - 电 通 信 技 术 
大 类 - 数字 信息 的 传输 小 类 ;关键 词 则 主要 涉及 网 络 
安全 、 服 务 器 承 压 能 力 控制 相关 。2014 - 2018 年 间 ， 
IPC 主要 为 G06F17/30、C06Q50/06 .G06010706 以 及 
C06K9/62 .HO4N19 等 ,新 增 了 电学 部 - 电 通信 技术 大 
类 -图 像 通信 小 类 以 及 物理 部 - 计算 推算 计数 大 类 - 
数据 识别 小 类 等 技术 ;关键 词 多 偏向 应 用 ,如 交通 、 移 
动 通讯 电力 能源 .信息 检索 等 方面 。 

三 (2)IPC - 边缘 关键 词 共 现 网 络 2004 -2008 年 间 ， 
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IPC 主要 为 GC06F19/00 、G06F17/30 、G05B13/04 以 及 
G05B19/418 等 ,对 应 的 技术 领域 新 增 了 为 物理 部 - 控 
制 调节 大 类 - 一 般 的 控制 或 调节 系统 小 类 ;关键 词 则 
主要 是 测试 .网 络 安全 等 必要 技术 相关 术语 以 及 人 工 
智能 、Web 服务 、 具 体 应 用 相关 的 术语 。2014 - 2018 
年 间 ,IPC 主要 为 G06F17/30 、G06Q50/06 、G05B23/02 
以 及 G01R31/12 等 ,COIR 为 物理 部 -测量 测试 大 类 
-测量 电磁 变量 小 类 ;关键 词 涉 及 了 机 器 学 习 、 深 度 学 
习 \ 计 算 机 视觉 等 技术 术语 和 网 络 安全 防护 、 网 站 维护 
等 必 备 的 基础 术语 ,以 及 各 领域 的 应 用 相关 技术 词汇 


(如 金融 .电气 智慧 城市 交通 等 ) 。 
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12 2009 -2013 年 IPC 分 类 号 -关键 词 共 现 网 络 


4.3 基于 主体 的 专利 文献 与 学 术 论文 关联 关系 分 析 
针对 形成 的 网 络 图 以 及 呈现 的 结果 ,对 其 关联 关 
系 做 进一步 的 分 析 。 


4.3.1 技术 演化 分 析 
内 容 方面 ,在 专利 分 类 号 的 种 类 上 ,3 个 时 间 段 分 
别 为 4 种 15 种 ,44 种 ,各 属 不 同 的 大 部 。2004 - 2008 
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铜 训 主 要 集中 分 布 在 物理 大 部 下 的 “计算 ; 推算; 计 
美发 明 ,2009 - 2013 年 中 增加 了 物理 大 类 的 “ 测 
晤 ;测试 "类 发 明 与 电学 大 类 的 “ 电 通 信 技 术 "相关 专 
利 执 术 ,在 第 2014 - 2018 年 间 , 更 是 拓展 到 物理 大 部 
HR 入 号 装置 “控制 ;调控 ” .电学 大 部 的 “发 电 、 变 电 
或 配 电 ”. 作 业 运 输 大 部 的 “ 磨 前 ;抛光 ”以 及 机 械 工程 
区 六 的 “昭明; 加热; 武器 ;爆破 -气体 或 液体 的 贮存 或 
分 配 ” 相 关 的 专利 技术 创新 。 可 见 , 越 来 越 多 的 应 用 领 
域 弄 始 重视 数据 挖掘 的 利用 与 创新 。 
GE 在 核心 节点 上 ,在 2014 年 以 前 的 2 个 时 间 段 里 ， 
G0GF17730 都 处 于 核心 位 置 ,是 最 重要 的 节点 。 而 在 
2044 年 之 后 ,核心 节点 在 G06F17/30 的 基础 上 ,又 增 
加 了 G06Q50/06。 虽 然 技 术 上 均 属 于 G06 物理 部 下 的 
“计算 ;推算 ;计数 ”大 类 ,但 是 前 者 主要 是 电 数 字数 据 
处 理 中 的 “信息 检索 ;及 其 数据 库 结构 " 相关 技术 创 
新 ,后 者 是 专门 适用 于 行政 .商业 ,金融 ,管理 .监督 或 
预测 目的 的 数据 处 理 系统 或 方法 中 的 “电力 .天然气 或 
水 供应 ”相关 技术 。G06F17/30 仍 是 计算 机 网 络 技术 、 
数学 算法 这 类 “数据 挖 据 ” 的 主流 技术 ,而 G06Q50706 
作为 核心 的 出 现 ,表示 “数据 挖掘 "相关 技术 创新 不 再 
仅 集中 于 计算 机 领域 ,在 电力 水 利 检测 方面 也 涉猎 颇 
广 。 

技术 耦合 演化 方面 ,在 20059 -2013 年 间 ,G06F17/ 
30 与 HO4L29/06 (08)、GO6N3/12 以 及 G06F17/50 
(27) 有 着 较 强 的 耦合 度 , 即 “信息 检索 及 其 数据 库 结 
构 ” 与 “通信 控制 通信 和 处理" 常 出 现在 一 个 专利 中 ,“ 基 
于 遗传 模型 的 的 计算 机 系统 ”与 “计算 机 辅助 设计 ( 自 


13 2014 -2018 年 IPC 分 类 号 -关键 词 共 现 网 络 


动 分 析 的 自然 语言 处 理 技术 )” 常 出 现在 同一 专利 发 
明 中 。 在 2014 - 2018 年 间 ,G06Q50/06 与 G06Q10/06 
以 及 G06F17/30 形成 较为 稳定 的 耦合 关系 , 即 " 信息 
检索 及 其 数据 库 结构 “行政 管理 相关 的 数据 处 理 系 
统 或 方法 "以 及 "适用 于 电力 、 天 然 气 或 水 供应 经 营 部 
门 的 系统 或 方法 " 间 的 关联 度 较 高 。2009 - 2013 年 的 
技术 耦合 , 主要 以 数据 挖掘 相关 的 技术 为 主 ,而 2014 
-2018 年 更 重视 技术 与 领域 应 用 的 结合 ,这 一 过 程 
中 ,技术 发 明 创新 的 重心 由 相关 技术 的 优化 改进 发 展 
到 特定 领域 内 的 特定 应 用 ,取得 了 一 定 的 成 效 。 
4.3.2 基于 主体 的 一 维 关系 发 现 

由 图 8 -图 10 的 演变 来 看 ,在 2004 - 2008 年 间 ， 
核心 主体 为 清华 大 学 、 上 海 交 通 大 学 以 及 浙江 大 学 ; 
2009 - 2013 年 间 的 核心 主体 是 上 海 交 通 大 学 、 重 庆 大 
学 .南京 邮电 大 学 ,此 阶段 电力 公司 集合 作为 重要 节点 
出 现 ;2014 -2018 年 间 ,国家 电网 核心 成 为 最 核心 的 主 
体 ,占据 图 7 将 近 172 的 位 置 ,与 其 强 联系 的 模块 则 以 
电力 公司 为 主 。 
由 于 专利 主体 - 关键 词 耦合 关注 的 是 学 术 型 创新 
人 才 , 即 具有 双重 身份 的 技术 人 员 ,因此 会 忽略 掉 一 部 
分 只 做 技术 创新 的 发 明 人 ,所 以 这 种 核心 主体 的 演变 
并 不 能 直接 说 明 数 据 挖掘 技术 最 先是 从 高 校 发 展 的 。 
男 一 方面 ,经 过 对 实证 数据 的 计算 ,学 术 型 发 明 人 占 比 
从 2004 - 2008 年 的 30% 变 为 62. 26% 再 到 2014 - 
2018 年 的 77.33% ,在 一 定 程 度 上 可 以 看 出 学 术 型 发 
明 人 在 技术 发 明 中 的 占 比 越 来 越 大 。 

在 最 初 (2004 - 2008 年 间 ) 数 据 挖掘 相关 专利 申 
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请 的 主体 中 ,同时 注重 学 术 创 新 的 主要 是 高 校 的 创新 
者 ,这 类 发 明 人 占 该 阶段 全 部 主体 的 30% ;在 技术 初 
步 发 展 阶段 (2009 -2013 年 间 ) ,企业 (如 电力 公司 等 ) 
开始 重视 专利 主体 的 学 术 背景 ,作为 一 个 子 群 出 现在 
耦合 网 络 中 ,该 阶段 发 表 过 学 术 文 献 的 发 明 人 占 比 为 
62.26% ;而 在 数据 挖掘 相关 技术 迅速 发 展 (2014 - 
2018 年 间 ) 的 进程 中 ,拥有 学 术 型 创新 人 才 的 企业 已 
经 可 以 与 高 校 分 庭 抗 礼 ,而 该 阶段 有 论文 发 表 的 发 明 
人 占 到 77.33% 。 在 数据 挖掘 相关 技术 的 整个 发 展 创 
新 中 ,学 术 型 创新 人 才 由 不 足 1/3 增长 到 接近 4/5 ,可 
见 数据 挖掘 相关 的 科学 研究 与 技术 发 明 的 关联 是 不 断 
增强 的 ,具备 科研 能 力 的 创新 型 人 才 对 专利 活动 产生 
了 重要 的 影响 。 同 时 ,以 电力 行业 为 主 的 企业 从 无 到 
有 体现 了 产业 与 学 术 界 之 间 逐 渐 形成 了 较 高 的 知识 
能 下 下 补 。 
€ 专利 主体 -关键 词 的 二 维 关系 发 现 
CN 在 关键 词 演化 过 程 中 ,2004 - 2008 年 间 主 要 是 计 
第 阮 网 络 .计算 机 视觉 以 及 服务 器 相关 的 关键 词 ;2009 
-2813 年 间 , 在 前 一 阶段 的 基础 上 增加 了 服务 器 优 
佐 络 安全 以 及 分 析 类 关键 词 ;2014 - 2018 年 间 , 核 
建 词 的 种 类 大 大 增多 ,主要 集中 在 数据 分 类 、 算 法 
相 泡 ,人工 智能 (机 器 学 习 、 深 度 学 习 、 神 经 网 络 ) 、 电 
鸡 卓 场 等 相关 关键 词 ( 见 图 8 - 图 10) 。 同 类 词 的 表达 
多 桩 ,内 容 上 更 加 细致 。 
< 在 主体 -关键 词 炮 合 中 ,由 于 给 定 的 关键 词 可 能 
相似 或 相近 ,形成 了 共 关键 词 的 现象 。 不 同 主体 间 的 
共 看 关键 词 有 所 偏向 :高 校 间 的 共 现 关键 词 偏向 于 理 
论 依 究 ,而 企业 与 高 校 间 的 共有 关键 词 除了 相关 技术 
类 名 词 之 外 ,更 倾向 于 应 用 领域 ;企业 间 的 共有 关键 词 
则 主要 以 应 用 类 为 主 。 不 同时 间 段 呈现 出 的 共 关 键 词 
也 各 有 特点 :2004 - 2008 年 间 , 共 关键 词 为 “数据 融 
合 “ 特 征 选 择 "“ 城 市 规划 ”“ 空 间 对 象 综合 ” ;2009 - 
2013 年 间 , 共 关键 词 为 “支持 向 量 机 ”"“ 分 布 式 计算 ” 
“一 体 化 监控 系统 ”“IEC61850”“ 综 合 应 用 服务 器 ”“ 谐 
波 治理 "“ 智 能 变电站 ”“ 认 知 无 线 电 ”等 ;2014 - 2018 
年 间 , 共 关键 词 为 “大 数据 “神经 网 络 ”多 目标 优化 ” 
“支持 向 量 机 ”“ 关 联 规 则 ”“ 储 能 系统 “层次 分 析 法 ” 
等 。 

随 着 时 间 的 发 展 , 主题 与 主体 的 关联 越 来 越 多 , 专 
利 主体 重视 的 主题 相似 度 也 在 增加 ,说 明 这 些 学 术 主 
题 可 能 与 该 阶段 相关 发 明 创造 的 核心 技术 有 关 。 同 
时 ,除了 与 企业 应 用 相关 的 关键 词 ,其 他 共有 关键 词 大 
多 是 该 时 间 段 下 较为 热门 的 技术 主题 ,这 些 技术 主题 


很 快 被 多 个 主体 关注 并 应 用 ,可 见 数据 挖掘 技术 积极 
吸纳 新 的 科学 .技术 知识 ,迅速 发 展 。 在 2014 - 2018 
年 间 ,一 些 其 他 学 科 ( 如 运筹 学 等 ) 的 相关 主题 也 成 为 
颇 为 高 频 的 共 关 键 词 ,说明 这 类 关键 词 在 该 时 间 段 内 
发 挥 了 重要 的 作用 ,一 定 程 度 上 促进 了 数据 挖掘 相关 
的 发 明 创造 。 可 见 在 技术 创新 的 过 程 中 ,会 出 现 与 之 
不 直接 相关 的 学 科 主 题 , 直接 或 间接 地 影响 技术 问题 
的 解决 。 

4.3.4 基于 主体 的 技术 - 关键 词 网 络 关系 演化 分 析 

不 同 阶段 的 核心 主题 有 着 明显 的 区 别 ,如 图 11 - 
13 所 示 ,在 2004 -2008 年 间 ,涉及 的 技术 术语 并 不 
是 数据 挖掘 的 主要 技术 ,但 却 是 在 技术 实现 过 程 中 可 
能 使 用 的 相同 或 相近 的 开发 语言 ,为 数据 挖掘 技术 创 
新 提供 支持 ;服务 发 现 相关 主题 ,可 能 是 为 了 提高 服 
务 , 吸 引 受 众 , 从 而 提出 数据 挖掘 的 需求 。 在 2009 - 
2013 年 间 ,主题 主要 是 网 络 安全 和 服务 器 承 压 能 力 控 
制 ,此 时 数据 挖 气 技 术 基 本 成 型 ,需要 深入 考虑 优化 方 
向 的 问题 。2013 -2018 年 间 , 主 题 多 以 应 用 领域 为 主 ， 
其 中 电网 相关 技术 术语 最 多 ,同时 也 涉及 了 图 像 识别 
这 类 偏 技 术 理 论 方向 的 专业 术语 。 

不 同 阶 段 的 边缘 主题 相似 度 较 高 ,都 涉及 了 网 络 
安全 、 服 务 器 维护 这 类 必 备 的 基础 性 技术 术语 以 及 需 
求 类 应 用 领域 的 相关 术语 。 不 同 之 处 则 在 于 在 2004 
-2008 年 间 , 数 据 挖掘 刚刚 起 步 ,边缘 主题 提出 了 机 
器 学 习 深度 学 习 等 人 工 智能 相关 的 算法 ,而 这 类 主题 
在 2014 年 以 后 成 为 核心 主题 。 可 见 一 项 技术 的 创新 
改进 ,需要 有 一 定 的 积累 与 准备 ,2014 -2018 年 的 边缘 
主题 ,在 几 年 后 同样 可 能 成 为 核心 主题 ,成 为 数据 挖掘 
的 核心 技术 。 

由 于 上 述 特点 ,选择 基于 专利 主体 的 IPC - 核心 
主题 的 共 现 网 络 , 分 析 发 现 技 术 主 题 关 联网 络 的 演化 
情况 ,更 能 反映 专利 核心 技术 与 学 科 主 题 的 关联 关系 。 

(1)2004 - 2008 年 间 , 数 据 挖 气 涉 及 的 技术 领域 
主要 为 电 数 字数 据 处 理 技术 ,行政 管理 金融 的 数据 处 
理 系统 或 方法 .信息 检索 及 其 数据 库 结 构 技 术 , 这 些 技 
术 与 科学 发 展 中 的 网 络 开 发 .服务 发 现 相 关联 ,这 些 科 
学 主题 实际 是 在 数据 挖 据 技 术 形成 过 程 中 提出 的 一 些 
需求 主题 ,与 行政 ,管理 金融、 商业 等 领域 相 匹 配 。 

(2 )2009 -2013 年 间 , G06F17/30 、H04L29/06 与 
网 络 安 全 类 主题 相关 联 ,涉及 的 技术 领域 为 信息 检索 
及 其 数据 库 结构 技术 以 及 通信 控制 与 处 理 技 术 。 在 网 
络 通讯 中 ,数据 对 于 开发 者 来 说 是 透明 的 ,因此 重视 网 
络 安全 、 防 止 信息 泄露 是 至 关 重要 的 。G06F21/00、 
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G0O6K9/62 以 及 G06F21755 与 服务 器 承 压 能 力 控制 主 
题 相关 联 ,涉及 的 技术 领域 为 保护 计算 机 及 其 部 件 , 程 
序 或 数据 的 安全 装置 以 及 数据 识别 技术 ,服务 器 承 压 
能 力 包括 最 大 并 发 用 户 数 、 吞 叶 量 、 容 灾 恢 复 等 。 虽然 
这 些 科学 主题 与 技术 有 一 定 的 差异 ,但 都 是 为 了 对 数 
据 挖掘 做 进一步 的 优化 ,提出 优化 的 方向 。 

(3 )2014 - 2018 年 间 , HO4N19/xx 与 图 像 识 别 主 
题 相关 联 ,涉及 的 技术 为 图 像 通信 技术 ,其 发 明 人 拥有 
图 像 识别 的 学 科 背 景 ,使 得 技术 发 明 与 科学 发 现 良好 
地 融合 渗透 ,是 数据 挖掘 的 重要 组 成 部 分 。G06F、 
GO6N .G06Q .GO1R 以 及 HO04L 与 交通 教育、 移动 通讯 
等 应 用 领域 主题 相关 联 , G06Q、H02J、GO1R、G05B 以 
及 G06F 与 电网 相关 应 用 领域 的 主题 关联 , G06Q、 
GQ6F .G06K .G06R 以 及 G08B 与 能 源 应 用 相关 主题 存 
在 甘 联 ,这 些 技 术 主题 共 现 集中 在 各 个 应 用 领域 ,电力 
能 源 行 业 应 用 尤为 突出 。 科 学 知识 与 技术 创新 共同 实 
路 扫 应 用 领域 ,促进 了 知识 在 科学 与 技术 中 的 传递 。 
FI 地 5/00 与 光纤 . 光 力 效应 ,设备 等 物理 材料 相关 主 
题 养 联 , 该 技术 为 保护 装置 或 观测 装置 ,二 者 都 是 聚焦 
所 葱 理 硬件 的 保护 改良 ,这 一 技术 与 主题 具有 极 高 的 
柯 僻 性 。 B24B51/00 与 G05B19/418 、G08G1/xx 与 信 
语 陷 索 ( 自然 语言 处 理 ,关联 映射 等 ) 及 工业 生产 相关 
关 襄 存在 关系 ,相关 技术 为 用 于 磨 削 或 抛光 的 机 床 装 
置 或 工艺 .道路 车 辆 的 交通 控制 系统 。 这 一 技术 主题 
闻 唾 相似 度 不 高 ,但 拥有 这 类 科学 背景 的 学 术 型 发 明 
人 浊 行 了 作业 运输 领域 的 相关 创新 ,可 见 这 类 科学 知 
识 对 作业 运输 领域 的 数据 挖掘 创 新 起 着 重要 作用 。 
《在 数据 挖掘 的 15 年 间 , G06F17/30( 物理 部 - 计 
算 推算 计数 大 类 - 电 数字 数据 处 理 小 类 - 信息 检索 及 
其 数据 库 结构 大 组 ) 一 直 都 是 其 核心 创新 领域 ,相关 学 
术 型 发 明 人 的 学 科 背 景 随 着 数据 挖掘 核心 主题 的 变化 
而 变化 ,有 些 主 题 是 直接 相关 的 ,有 些 主题 不 直接 相 
关 , 但 是 都 解决 了 问题 ,推动 了 技术 创新 的 发 展 ,促进 
了 技术 在 领域 内 的 应 用 。 在 2004 - 2008 年 .2009 - 
2013 年 .2014 - 2018 年 3 个 时 间 段 内 ,电力 系统 、 算 
法 .数据库 技术 .神经 网 络 .无 线 传 感 .网 络 安全 等 关键 
词 是 不 变 的 , 且 随 着 时 间 的 发 展 不 断 更 新 补充 ,可 见 这 
类 学 术 背 景 的 发 明 人 在 该 类 专利 发 明 中 的 作用 是 重要 
的 。 


5 结论 


Pe 


本 文通 过 对 专利 主体 ,专利 技术 ,学 术 论文 关键 词 
的 多 维 共 现 分 析 , 讨 论 了 专利 主体 关系 网 络 .专利 主体 


-关键 词 关 系 网 络 以 及 技术 - 关键 词 关系 网 络 的 演化 
情况 ,探究 了 基于 专利 主体 的 专利 文献 与 学 术 论文 间 
主体 .主题 的 关联 关系 。 在 数据 挖掘 技术 发 展 中 ,学术 
型 发 明 人 发 挥 着 越 来 越 重 要 的 作用 ,有 学 术 成 果 的 发 
明 人 将 其 特有 的 学 科 知 识 运用 在 技术 创新 中 ,一定 程 
度 上 促进 了 技术 创新 。 而 由 4.3.4 的 技术 - 关键 词 演 
变 关系 中 可 知 , 在 技术 主题 网 络 演化 的 过 程 中 ,大 部 分 
学 术 型 发 明 人 的 科学 发 现 与 其 技术 创新 是 相近 的 ,部 
分 技术 主题 间 呈 现 高 度 的 统一 ;同时 也 存在 少数 技术 
与 主题 不 直接 相关 ,差异 度 较 大 ,但 在 一 定 程度 上 对 数 
据 挖掘 技术 的 发 展 起 到 了 促进 的 作用 。 随 着 时 间 的 推 
移 , 数 据 挖掘 相关 科学 发 现 展现 的 学 科 领 域 越 来 越 广 ， 
而 相应 的 技术 发 明 的 应 用 领域 也 越 来 越 多 , 可见 数据 
挖掘 相关 技术 领域 的 学 科 发 现 对 其 技术 发 明 有 着 积极 
的 影响 。 多 学 科 多 领域 的 科学 发 现 与 技术 的 融合 , 必 
然 促 进 数据 挖掘 或 其 他 技术 的 创新 与 应 用 ,推动 相关 
知识 理论 的 发 展 。 
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>Research on the Relationship Between Patent Documents and Academic Papers Based on Patent Subjects 


一 一 人 Case Study of Data Mining 
二 Ning Zichen Wei Lai 
O School of Information Science and Technology, Northeast Normal University, Changchun, 130117 


Abstract: | Purpose/ significance | The patent documents and academic papers show the new progress of techno- 
logical innovation and scientific research respectively. Combining patent documents with academic papers through pa- 
tent subjects, and then conducting technical subject evolution analysis, which has certain reference significance for 
further discovering understanding the relationship between patent technology and scientific research. | Method/ 
process | Taking the academic inventors in the field of data mining as the link, the association method was proposed 
and the research framework was constructed from 3 perspectives of patent subject-keyword coupling, IPC coupling and 
IPC-keyword co-occurrence. Then this paper analyzed the evolution of multi-dimensional relationship among subjects, 
technologies and themes in different time periods, and explored the relationship between patent documents and aca- 
demic papers. | Result/conclusion | The role of academic inventors in the innovation of data mining is more and 
more important. The technical themes of most subjects are similar, and some even show a high degree of unity. How- 
ever, there are also a few technologies that are not directly related to the themes, and the degree of difference is also 
large. But whether technology is directly related to the theme matter or not, technology inventions and scientific re- 
search have achieved deeper mutual penetration in the field of data mining. 
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